ارائه روشی کارا جهت تطابق الگوی تقریبی در ترجمه ماشینی مبتنی بر مثال

پایان نامه
چکیده

ترجمه ماشینی یکی از کاربردی ترین شاخه ها در زمینه پردازش زبان طبیعی است. ترجمه ماشینی فرآیند تجزیه و تحلیل خودکار متن در زبان مبدأ و تولید متن معادل آن در زبان هدف است. یکی از سیستم های ترجمه ماشینی سیستم مبتنی بر مثال است که ویژگی اصلی آن استفاده از پیکره متنی دو زبانه به عنوان پایگاه دانش می باشد تا بجای ترجمه لفظ به لفظ و بعضاً اشتباه و نامتعارف، یک ترجمه مشابه ترجمه انسانی بدست آید. فرآیند تطابق یکی از مهمترین بخش ها در سیستم های ترجمه ماشینی مبتنی بر مثال است. این فرآیند برای یافتن نزدیک ترین جمله موجود در پیکره متنی جهت ترجمه جمله ورودی می باشد. در این پژوهش، رویکرد جدیدی بر مبنای تطابق تقریبی جملات ارائه شده است که از شباهت معنایی برای یافتن نزدیکترین جمله استفاده می کند. مهمترین مزیت این روش قابلیت استخراج جملاتی است که اگرچه از لحاظ لغوی متفاوتند اما معنای بسیار نزدیکی به هم دارند. در این تحقیق ابتدا معیار شباهتی بر مبنای الگوریتم های یادگیری ماشین و تکنیک های پردازش زبان طبیعی برای تعیین شباهت معنایی جملات ارائه شده است. سپس با توجه به کارایی این رویکرد در تعیین شباهت معنایی از آن در تطابق تقریبی استفاده شده است. در راهکار پیشنهادی برای تطابق تقریبی جملات ابتدا با استفاده از رویکرد بازیابی اطلاعات جملات کاندید به عنوان جملات نزدیک به جمله ورودی مشخص شده و سپس با استخراج ویژگی های زبان شناسی، شباهت میان جمله ورودی و جملات کاندید به منظور تعیین نزدیکترین جمله محاسبه می گردد. هم چنین به منظور افزایش دقت محاسبه شباهت و کاهش خطا، وزن بهینه هر یک از ویژگی ها با استفاده از الگوریتم رگرسیون خطی تعیین شده است. نتایج آزمایش نشان می دهد رویکرد پیشنهادی به شکل قابل توجهی عملکرد فرآیند تطابق را بهبود می بخشد.

منابع مشابه

نگرشی بر ترجمه ماشینی

از دیر باز بشر همیشه در آرزوی اختراع دستگاهی بوده است که بتواند متون را از زبان مبداء به زبان مقصد با سرعت و دقت فراوان ترجمه کند. تلاش برای رسیدن به این آرزو بیش از پنج دهه است که آغاز شده است و محققان دسا اوردهایی در زمینه طراحی سیستم ها و ساخت ماشین های مترجم بدست آورده اند ولی نام ماشینهای مترجم همواره مفهوم منفی را در ذهن افراد تداعی می کند و بیشتر مترجمان و محققان نظر منفی درباره ماشینهای...

متن کامل

تخمین موثری از شباهت متون در ترجمه ماشینی مبتنی بر مثال

ترجمه ماشینی یکی از مهمترین شاخه¬های تحقیقاتی در زمینه پردازش زبان طبیعی می¬باشد. ترجمه ماشینی عبارت است از برگردان متنی از یک زبان به زبان دیگر توسط ماشین به طوری که مفهوم متن در زبان مبدأ بدون تغییر به زبان مقصد منتقل شود. یکی از سیستم¬های ترجمه ماشینی، سیستم مبتنی بر مثال می¬باشد. در این رویکرد برای ترجمه یک ترکیب از کلمات، به مجموعه متون ترجمه شده قبلی مراجعه می¬شود تا بجای ترجمه لفظ به لفظ...

15 صفحه اول

ارائه روشی جهت پیش‌بینی اسلامپ بتن مبتنی بر مدل نروفازی تطبیقی

کارایی بتن از اهمیت بسیار بالایی در پروژه‌های عمرانی برخوردار است. یکی از متداول‌ترین روش‌ها جهت اندازه گیری کارایی بتن، آزمایش اسلامپ است. جهت صرفه‌جویی در زمان، هزینه و مصالح، بهتر است از روش‌های هوشمندی جهت پیش‌بینی اسلامپ بتن استفاده شود. در این تحقیق یکی از روش‌های مبتنی بر محاسبات نرم بکار گرفته می‌شود تا با طراحی شبکه‌ای، بدون نیاز به انجام آزمایش‌های فیزیکی پرزحمت، بتوان تخمینی از اسلام...

متن کامل

ارائه روشی مبتنی بر الگوریتم‌های هوشمند برای حل پخش‌بار احتمالی جهت برنامه‌ریزی و بهره‌برداری از ریزشبکه‌ها

One of the basic components of future distribution networks are renewable energy resources (RER). The uncertainty in power production of renewable resources such as wind and solar as well as load is another characteristic of such networks. Conventional power flow methods as a basic tool for power system studies may not be suitable for active distribution networks such as microgrids. In this pap...

متن کامل

ارائه روشی آماری مبتنی بر الگوی دودویی محلی بهبود یافته جهت طبقه بندی تصاویر بافتی

الگوی دودویی محلی در سالهای اخیر به یکی از توصیفگرهای پر کاربرد بافت تبدیل شده است. اکثر روش های برگرفته از این الگو با هدف افزایش مقاومت این روش نسبت به نویز و سادگی پیاده سازی، با تغییر در آستانه گذاری و کدگذاری ارائه شده اند. از جمله الگوی سه تایی محلی و الگوی سه تایی محلی تکمیل شده، که این روشها از یک مقدار آستانه در سه سطح در استخراج ویژگی دودویی، از بافت استفاده می کنند. هدف از این پا...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023